智能论文笔记

Mine yOur owN Anatomy: Revisiting Medical Image Segmentation with Extremely Limited Labels

Chenyu You , Weicheng Dai , Fenglin Liu , Haoran Su , Xiaoran Zhang , Lawrence Staib , James S. Duncan

分类：人工智能 | 计算机视觉 | 机器学习

2022-09-27

关于对比学习的最新研究仅通过在医学图像分割的背景下利用很少的标签来实现出色的性能。现有方法主要关注实例歧视和不变映射。但是，他们面临三个常见的陷阱：（1）尾巴：医疗图像数据通常遵循隐式的长尾分配。盲目利用训练中的所有像素会导致数据失衡问题，并导致性能恶化；（2）一致性：尚不清楚分割模型是否由于不同解剖学特征之间的类内变化而学会了有意义但一致的解剖学特征；（3）多样性：整个数据集中的切片内相关性已得到明显降低的关注。这促使我们寻求一种有原则的方法来战略利用数据集本身，以发现不同解剖学观点的类似但不同的样本。在本文中，我们介绍了一种新型的半监督医学图像分割框架，称其为您自己的解剖结构（MONA），并做出了三个贡献。首先，先前的工作认为，每个像素对模型培训都同样重要。我们从经验上观察到，仅此单单就不太可能定义有意义的解剖特征，这主要是由于缺乏监督信号。我们通过使用更强大的数据增强和最近的邻居展示了学习不变的两个简单解决方案。其次，我们构建了一组目标，鼓励模型能够以无监督的方式将医学图像分解为解剖特征的集合。最后，我们在具有不同标记设置的三个基准数据集上的广泛结果验证了我们提出的MONA的有效性，该数据在不同的标签设置下实现了新的最新设置。

translated by 谷歌翻译

A Multitask Deep Learning Model for Parsing Bridge Elements and Segmenting Defect in Bridge Inspection Images

Chenyu Zhang , Muhammad Monjurul Karim , Ruwen Qin

分类：计算机视觉

2022-09-06

美国庞大的桥梁网络对其维护和康复提出了很高的要求。手动视觉检查的大量费用在某种程度上是一定程度的负担。高级机器人已被利用以自动化检查数据收集。在大量检查图像数据中，自动化多类元素的分割以及元素的表面缺陷将有助于对桥梁条件进行有效评估。培训单独的单任务网络，用于元素解析（即多类元素的语义分割）和缺陷分段无法在检查图像中合并这两个任务之间的密切连接，其中存在可识别的结构元素和明显的表面缺陷。本文的动机是开发多任务深神经网络，该网络完全利用桥梁元素和缺陷之间的这种相互依赖性来提高模型的性能和概括。此外，研究了提议的网络设计改善任务性能的有效性，包括特征分解，串扰共享和多目标损耗函数。开发了带有桥梁元件和腐蚀的像素级标签的数据集，用于培训和评估模型。评估开发的多任务深神经网络的定量和定性结果表明，推荐的网络不仅超过了独立的单任务网络（在桥梁解析上高2.59％，在腐蚀细分方面高2.59％），而且在计算时间和实施中也是如此能力。

translated by 谷歌翻译

A Deep Neural Network for Multiclass Bridge Element Parsing in Inspection Image Analysis

Chenyu Zhang , Muhammad Monjurul Karim , Zhaozheng Yin , Ruwen Qin

分类：计算机视觉

2022-09-05

空中机器人（例如无人机）已被利用进行桥梁检查。可以通过板载摄像机收集具有可识别的结构元素和明显表面缺陷的检查图像，以提供有价值的信息以进行条件评估。本文旨在确定用于在检查图像中解析多类桥梁元素的合适的深神经网络（DNN）。一组广泛的定量评估以及定性示例表明，高分辨率净（HRNET）具有所需的能力。通过数据增强和130张图像的训练样本，预先训练的HRNET有效地转移到结构元件解析的任务中，并达到了92.67％的平均F1得分和86.33％的平均值。

translated by 谷歌翻译

Learning correspondences of cardiac motion from images using biomechanics-informed modeling

Xiaoran Zhang , Chenyu You , Shawn Ahn , Juntang Zhuang , Lawrence Staib , James Duncan

分类：计算机视觉

2022-09-01

从图像中学习心脏运动中的时空对应关系对于理解心脏解剖结构的潜在动力学很重要。许多方法明确施加了平滑度约束，例如位移矢量字段（DVF）上的$ \ Mathcal {l} _2 $ NORM，而通常忽略转换中的生物力学可行性。其他几何约束要么正规化特定的感兴趣区域，例如在心肌上施加不可压缩性，要么引入其他步骤，例如在物理模拟的数据集上训练单独的基于网络的正规器。在这项工作中，我们提出了一个明确的生物力学知识，因为在所有心脏结构中对更通用的生物力学上可行的转化进行建模，而无需引入额外的训练复杂性，因此对预测的DVF进行了正则化。在2D MRI数据的背景下，我们验证了两个公开可用数据集的方法，并执行广泛的实验，以说明与其他竞争性正规化方案相比，我们提出的方法的有效性和鲁棒性。我们提出的方法可以通过视觉评估更好地保留生物力学特性，并使用定量评估指标显示分割性能的优势。该代码可在\ url {https://github.com/voldemort108x/bioinformed_reg}上公开获得。

translated by 谷歌翻译

Incremental Learning Meets Transfer Learning: Application to Multi-site Prostate MRI Segmentation

Chenyu You , Jinlin Xiang , Kun Su , Xiaoran Zhang , Siyuan Dong , John Onofrey , Lawrence Staib , James S. Duncan

分类：计算机视觉 | 人工智能 | 机器学习

2022-06-03

最近已经为医疗图像分割任务创建了许多医疗数据集，并且自然质疑我们是否可以使用它们来依次训练（1）在所有这些数据集中表现更好的单个模型，并且（2）良好的概括和传输更好到未知的目标站点域。先前的工作通过在多站点数据集上共同训练一个模型来实现这一目标，该模型平均实现了竞争性能，但是这种方法依赖于所有培训数据的可用性的假设，从而限制了其在实际部署中的有效性。在本文中，我们提出了一个称为增量转移学习（ITL）的新型多站点分割框架，该框架以端到端的顺序方式从多站点数据集中学习模型。具体而言，“增量”是指顺序构建的数据集，而“转移”是通过利用每个数据集上嵌入功能的线性组合的有用信息来实现的。此外，我们介绍了ITL框架，在该框架中，我们在其中训练网络，包括具有预先训练的权重和最多两个分段解码器头的站点不合时宜的编码器。我们还设计了一种新型的站点级增量损失，以便在目标域上良好地概括。其次，我们首次表明利用我们的ITL培训计划能够减轻富有灾难性的遗忘问题，从而在渐进学习中遇到了挑战。我们使用五个具有挑战性的基准数据集进行实验，以验证我们的增量转移学习方法的有效性。我们的方法对计算资源和特定于领域的专业知识的假设最少，因此构成了多站点医学图像细分的强大起点。

translated by 谷歌翻译

DELTA: Dynamically Optimizing GPU Memory beyond Tensor Recomputation

Yu Tang , Chenyu Wang , Yufan Zhang , Yuliang Liu , Xingcheng Zhang , Linbo Qiao , Zhiquan Lai , Dongsheng Li

分类：机器学习

2022-03-30

有限的GPU记忆资源阻碍了深度神经网络的进一步发展。因此，高度要求GPU内存资源的优化。通常应用交换和重新计算，以更好地利用GPU记忆。但是，作为一个新兴领域，仍然存在一些挑战：1）静态和动态方法的重新计算效率受到限制。 2）交换需要手动卸载参数，这会产生巨大的时间成本。 3）没有这种动态和细粒的方法，涉及张量与当今的张量重新组件一起交换。为了纠正上述问题，我们提出了一个名为Delta（动态张量卸载和重新组件）的新型调度程序经理。据我们所知，我们是第一个在没有用户监督的情况下进行张量交换和张量重新组合的合理的动态运行时间调度程序。在Delta中，我们提出了一种过滤器算法，以选择要从GPU内存中释放出来的最佳张量，并提出导演算法，以选择每个张量的适当动作。此外，故意考虑预取和重叠以克服交换和重新计算张量引起的时间成本。实验结果表明，DELTA不仅节省了40％-70％的GPU记忆，从而超过了最新方法，而且还获得了可比的收敛结果，并获得了可接受的时间延迟。此外，与基准相比，当训练Resnet-101训练Resnet-101时，Delta在训练Resnet-50和2.25 $ \ times $时获得2.04 $ \ times $最大批量。此外，我们实验中的交换成本和重新计算成本之间的比较表明，在张量交换和张量重新计算上制定合理的动态调度程序的重要性，这在某些相关工作中反驳了交换应该是第一个也是最好的选择。

translated by 谷歌翻译

Decompose to Adapt: Cross-domain Object Detection via Feature Disentanglement

Dongnan Liu , Chaoyi Zhang , Yang Song , Heng Huang , Chenyu Wang , Michael Barnett , Weidong Cai

分类：计算机视觉

2022-01-06

无监督域适应（UDA）技术的最新进展在跨域计算机视觉任务中有巨大的成功，通过弥合域分布差距来增强数据驱动的深度学习架构的泛化能力。对于基于UDA的跨域对象检测方法，其中大多数通过对抗性学习策略引导域不变特征产生来缓解域偏差。然而，由于不稳定的对抗性培训过程，他们的域名鉴别器具有有限的分类能力。因此，它们引起的提取特征不能完全域不变，仍然包含域私有因素，使障碍物进一步缓解跨域差异。为了解决这个问题，我们设计一个域分离rcnn（DDF），以消除特定于检测任务学习的特定信息。我们的DDF方法促进了全局和本地阶段的功能解剖，分别具有全局三联脱离（GTD）模块和实例相似性解剖（ISD）模块。通过在四个基准UDA对象检测任务上表现出最先进的方法，对我们的DDF方法进行了宽阔的适用性。

translated by 谷歌翻译

Multiple Sclerosis Lesion Analysis in Brain Magnetic Resonance Images: Techniques and Clinical Applications

Yang Ma , Chaoyi Zhang , Mariano Cabezas , Yang Song , Zihao Tang , Dongnan Liu , Weidong Cai , Michael Barnett , Chenyu Wang

分类：计算机视觉

2021-04-20

多发性硬化症（MS）是中枢神经系统的慢性炎症和退行性疾病，其特征在于，白色和灰质的外观与个体患者的神经症状和标志进行地平整相关。磁共振成像（MRI）提供了详细的体内结构信息，允许定量和分类MS病变，其批判性地通知疾病管理。传统上，MS病变在2D MRI切片上手动注释，一个流程效率低，易于观察室内误差。最近，已经提出了自动统计成像分析技术以基于MRI体素强度检测和分段段病变。然而，它们的有效性受到MRI数据采集技术的异质性和MS病变的外观的限制。通过直接从图像学习复杂的病变表现，深度学习技术已经在MS病变分割任务中取得了显着的突破。在这里，我们提供了全面审查最先进的自动统计和深度学习MS分段方法，并讨论当前和未来的临床应用。此外，我们审查了域适应等技术策略，以增强现实世界临床环境中的MS病变分段。

translated by 谷歌翻译

NeuroExplainer: Fine-Grained Attention Decoding to Uncover Cortical Development Patterns of Preterm Infants

Chenyu Xue , Fan Wang , Yuanzhuo Zhu , Hui Li , Deyu Meng , Dinggang Shen , Chunfeng Lian

分类：机器学习

2023-01-01

Deploying reliable deep learning techniques in interdisciplinary applications needs learned models to output accurate and ({even more importantly}) explainable predictions. Existing approaches typically explicate network outputs in a post-hoc fashion, under an implicit assumption that faithful explanations come from accurate predictions/classifications. We have an opposite claim that explanations boost (or even determine) classification. That is, end-to-end learning of explanation factors to augment discriminative representation extraction could be a more intuitive strategy to inversely assure fine-grained explainability, e.g., in those neuroimaging and neuroscience studies with high-dimensional data containing noisy, redundant, and task-irrelevant information. In this paper, we propose such an explainable geometric deep network dubbed as NeuroExplainer, with applications to uncover altered infant cortical development patterns associated with preterm birth. Given fundamental cortical attributes as network input, our NeuroExplainer adopts a hierarchical attention-decoding framework to learn fine-grained attentions and respective discriminative representations to accurately recognize preterm infants from term-born infants at term-equivalent age. NeuroExplainer learns the hierarchical attention-decoding modules under subject-level weak supervision coupled with targeted regularizers deduced from domain knowledge regarding brain development. These prior-guided constraints implicitly maximizes the explainability metrics (i.e., fidelity, sparsity, and stability) in network training, driving the learned network to output detailed explanations and accurate classifications. Experimental results on the public dHCP benchmark suggest that NeuroExplainer led to quantitatively reliable explanation results that are qualitatively consistent with representative neuroimaging studies.

translated by 谷歌翻译

Controlling Commercial Cooling Systems Using Reinforcement Learning

Jerry Luo , Cosmin Paduraru , Octavian Voicu , Yuri Chervonyi , Scott Munns , Jerry Li , Crystal Qian , Praneet Dutta , Jared Quincy Davis , Ningjia Wu

分类：机器学习 | 人工智能

2022-11-11

This paper is a technical overview of DeepMind and Google's recent work on reinforcement learning for controlling commercial cooling systems. Building on expertise that began with cooling Google's data centers more efficiently, we recently conducted live experiments on two real-world facilities in partnership with Trane Technologies, a building management system provider. These live experiments had a variety of challenges in areas such as evaluation, learning from offline data, and constraint satisfaction. Our paper describes these challenges in the hope that awareness of them will benefit future applied RL work. We also describe the way we adapted our RL system to deal with these challenges, resulting in energy savings of approximately 9% and 13% respectively at the two live experiment sites.

translated by 谷歌翻译